iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 3
4
Blockchain

從0開始架構區塊鏈系列 第 3

Day03|打造一個簡易的區塊鏈(2):產生創世塊與挖掘新區塊

  • 分享至 

  • xImage
  •  

我們在昨天已經定義完交易、區塊、區塊鏈的主要格式與資料,今天的目標是架構起我們的簡易區塊鏈,並且能夠做到下面這四件事情

  1. 產生哈希/湊雜數(Hash)
  2. 產生創世塊
  3. 放置交易明細至新區塊中
  4. 挖掘新區塊

產生哈希數(Hash)

哈希/湊雜數可以想做是一種轉換方式,可以把任意長度的輸入轉換成固定長度的輸出,以SHA-1為例,它能夠把輸入值轉換成固定20個位元組的輸出。

哈希函數(hash function)必須同時滿足兩個條件:

  1. 同樣的輸入值必定得到相同的輸出值
  2. 得到的哈希數無法反推回原本的資料

以下面為例,Hello World!的字串能夠透過SHA-1的哈希函數轉換成:

2ef7bde608ce5404e97d5f042f95f89f1c232871

但同時產生的2ef7bde608ce5404e97d5f042f95f89f1c232871無法反推回原本的Hello World!。由於輸入資料的不同,往往我們可以把哈希數視作幾近隨機的位元組所構成(但仍然會因為哈希函數的不同而有所變異)

hash
這個網址有更多的哈希函式的轉換可以試玩看看,以Hello World!這個字串為例,各種轉換法輸出的哈希值也不相同。

Hello World!

在這裡我們先把下面這些資料連接後作為哈希函式的輸入:

  1. 前一個區塊的哈希值(previous_hash)
  2. 區塊產生當下的時間戳(timestamp)
  3. 所有的交易明細(transactions)
  4. 挖掘中的nonce

Our Hash

下面是我們今天的程式碼,其中transaction_to_string負責把交易明細轉換成字串、get_transactions_string負責把區塊紀錄的所有交易明細轉換成一個字串、get_hash負責依據這四筆資料產生相對應的哈希數。

import hashlib

def transaction_to_string(self, transaction):
    transaction_dict = {
        'sender': str(transaction.sender),
        'receiver': str(transaction.receiver),
        'amounts': transaction.amounts,
        'fee': transaction.fee,
        'message': transaction.message
    }
    return str(transaction_dict)

def get_transactions_string(self, block):
    transaction_str = ''
    for transaction in block.transactions:
        transaction_str += self.transaction_to_string(transaction)
    return transaction_str

def get_hash(self, block, nonce):
    s = hashlib.sha1()
    s.update(
        (
            block.previous_hash
            + str(block.timestamp)
            + self.get_transactions_string(block)
            + str(nonce)
        ).encode("utf-8")
    )
    h = s.hexdigest()
    return h

產生創世塊(genesis block)

創世塊就是開始部署區塊鏈時所產生的第一個區塊,創世塊通常具有劃時代的意義,雖然以第一個區塊的角度而言它不需要帶有任何交易紀錄、是個空區塊,但創造鏈的人可以把精神或是象徵性的東西寫入創世塊中藉此提醒後人(?),並以比特幣來說,比特幣的創世塊可以在這個網址查詢到。

const char* pszTimestamp = "The Times 03/Jan/2009 Chancellor on brink of second bailout for banks";

The Times 03/Jan/2009 Chancellor on brink of second bailout for banks.

是中本聰寫入創世塊中的一句話,這也是2009/01/03英國《泰晤士報》的頭版標題,這時候的世界還陷在2008金融風暴的危機中,這篇報導敘述了當時的英國正考慮進行財務紓困,或許中本聰只是單純想證明這區塊確實是當天寫入的,又或許透過《泰晤士報》的頭版標題又對政府與中心化金融機構進行一次諷刺。

The Times
圖片來源:The News Lens

由於這是我們的第一個區塊鏈,所以我們就在previous_hash的欄位給...........Hello World! 藉此紀念一下 ,並且難度與挖礦獎勵設定成區塊鏈的預設值,礦工這裡就直接填入我們的姓名,產生創世塊後就直接把創世塊加入到chain之中

def create_genesis_block(self):
    print("Create genesis block...")
    new_block = Block('Hello World!', self.difficulty, 'lkm543', self.miner_rewards)
    new_block.hash = self.get_hash(new_block, 0)
    self.chain.append(new_block)

放置交易紀錄至新區塊中

區塊過大會導致在網路傳播上的不易與耗時,也因此每個區塊的承載量是有容量大小的上限,那礦工如何選擇哪幾筆交易應該被優先處理呢?礦工通常會根據自身的利益選擇手續費高的交易優先被處理,因此在這裡我們選擇手續費最高的幾筆交易優先加入區塊中。但如果等待中的交易(pending_transactions)數目沒有到區塊的承載量上限的話,那麼自然我們可以全部處理了!

而大家所熟知的Bitcoin的區塊容量上限是1MB,在1MB的容量下平均可以接受3.3-7 TPS(Transaction per Seconds,每秒幾筆交易)(來源),這數字大家可能沒甚麼概念,但與大家常使用的Visa做個比較─Visa的平均處理速度為1700 TPS(來源),因此在bitcoin大規模被應用之前如何改進與增大TPS為社群熱門的研究題目,中本聰原先給的解決方案是增加區塊的容量,也就是提升原先設定的1MB區塊容量大小限制即可應對,增加TPS的路線與方法的不同甚至導致了社群的分裂,甚至產生了分岔(Fork)而生成了新的貨幣Bitcoin Cash(BCH),關於BTC與BCH的路線之爭與差異有興趣繼續深入研究的人可以參考這裡,關於分岔的議題之後我們會再探討。

而Ethereum的區塊容量則是根據耗用資源的多寡以Gas為單位,每個區塊有800萬Gas的限制,關於Ethereum耗用Gas的機制因為較為複雜,我們之後也會另外說明,它們都有區塊容量的上限以確保挖角到新區塊後廣播過程的順利。

def add_transaction_to_block(self, block):
    # Get the transaction with highest fee by block_limitation
    self.pending_transactions.sort(key=lambda x: x.fee, reverse=True)
    if len(self.pending_transactions) > self.block_limitation:
        transcation_accepted = self.pending_transactions[:self.block_limitation]
        self.pending_transactions = self.pending_transactions[self.block_limitation:]
    else:
        transcation_accepted = self.pending_transactions
        self.pending_transactions = []
    block.transactions = transcation_accepted

挖掘新區塊

接著我們就可以來挖掘產生新區塊了,挖掘的步驟是透過改變nonce值(從0,1,2,3....直到找到符合的nonce)而得到新的哈希數,在這裡我們把難度定義為"開頭有幾個0",也就是每次改變nonce、產生一個新的hash數後來確認有沒有符合要求(開頭有幾個0),如果符合就代表我們找到一個合規nonce值了!但如果沒有,就只好持續的往下找了。也因為運算量越大能夠找到合規的nonce值的機率也越大,也因此這個方法又被稱為Proof of Work(POW)

Mine

但透過這個方式區塊的產生時間會非常地不穩定,你可以到bitcoin的區塊瀏覽器看看產出的時間,bitcoin預設是每十分鐘應該要產出一個區塊,但也可以發現實際上每個區塊的產生時間會跟十分鐘有點落差,這是POW的必然結果。

在這裡的實作中,我們生成一個區塊後不停計算不一樣的nonce值,直到我們能夠找到合規的nonce為止,直到發現(挖掘)合規的nonce之後,就可以把挖出來的區塊置入鏈裡頭。

def mine_block(self, miner):
    start = time.process_time()

    last_block = self.chain[-1]
    new_block = Block(last_block.hash, self.difficulty, miner, self.miner_rewards)

    self.add_transaction_to_block(new_block)
    new_block.previous_hash = last_block.hash
    new_block.difficulty = self.difficulty
    new_block.hash = self.get_hash(new_block, new_block.nonce)

    while new_block.hash[0: self.difficulty] != '0' * self.difficulty:
        new_block.nonce += 1
        new_block.hash = self.get_hash(new_block, new_block.nonce)

    time_consumed = round(time.process_time() - start, 5)
    print(f"Hash found: {new_block.hash} @ difficulty {self.difficulty}, time cost: {time_consumed}s")
    self.chain.append(new_block)

今天的問題

問題來了:如果參與挖掘的人越來越多,那麼區塊不是一下就會被挖掘出來了嗎?是的,所以明天我們會來談談怎麼根據實際情形改變挖掘的難度!

到目前為止的文章都會放置在Github上,至於程式碼則放在這裡

Ref


上一篇
Day02|打造一個簡易的區塊鏈(1):定義格式
下一篇
Day04|打造一個簡易的區塊鏈(3):難度調整與確認哈希鏈
系列文
從0開始架構區塊鏈30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
iT邦新手 1 級 ‧ 2022-02-28 17:36:21

您好,這邊有個疑惑想請教一下:

好奇 timestamp,是從礦工的硬體提供的嗎?
如果是,則這裡產生一個疑惑不知理解是否有錯誤。

  1. 礦工是否有可能給了一個並非真正當時時間的 timestamp?
  2. 有查到一些資訊,我的理解是 1. 可能成立,但最後會再檢查,只要 timestamp 在一個合理區間,即可被認同。
  3. 如果在合理範圍即可認同,那麼如果有兩個礦工在同一個範圍提交,但是假設礦工A是正常產生 timestamp,礦工B在比較晚的時間使用了更早的 timestamp。那麼是否最後是以礦工B為主鏈呢?

感謝。

我要留言

立即登入留言